手写数学表达识别(HMER)是具有许多潜在应用的挑战性任务。 HMER的最新方法通过编码器架构实现了出色的性能。但是,这些方法符合“从一个字符到另一个字符”进行预测的范式,由于数学表达式或厌恶的手写的复杂结构,这不可避免地会产生预测错误。在本文中,我们为HMER提出了一种简单有效的方法,该方法是第一个将语法信息纳入编码器编码器网络的方法。具体而言,我们提出了一组语法规则,用于将每个表达式的乳胶标记序列转换为一个解析树。然后,我们将标记序列预测建模为具有深神经网络的树遍布过程。通过这种方式,提出的方法可以有效地描述表达式的语法上下文,从而减轻HMER的结构预测错误。在三个基准数据集上的实验表明,与先前的艺术相比,我们的方法实现了更好的识别性能。为了进一步验证我们方法的有效性,我们创建了一个大规模数据集,该数据集由从一万个作家中获取的100k手写数学表达图像组成。该工作的源代码,新数据集和预培训的模型将公开可用。
translated by 谷歌翻译
事实证明,机器学习在许多软件学科中都有用,包括计算机视觉,语音和音频处理,自然语言处理,机器人技术和其他一些领域。但是,由于其黑盒性质和大量资源消耗,其适用性受到了严重阻碍。绩效是以巨大的计算资源为代价实现的,通常会损害模型的鲁棒性和可信度。最近的研究一直在确定缺乏互动性是这些机器学习问题的主要来源。因此,互动机器学习(IML)由于其人类的模式和相对有效的资源利用而引起了研究人员的更多关注。因此,对交互式机器学习的最新评论在减轻建立以人为本模型的努力方面起着至关重要的作用。在本文中,我们对IML的最先进进行了全面分析。我们使用面向绩效/任务的混合分类法分析了显着的研究工作。我们使用自下而上的聚类方法来生成IML研究工作的分类法。关于对抗性黑盒攻击和基于IML的防御系统,探索性机器学习,资源约束学习和IML绩效评估的研究工作,在我们以优异为导向的分类学中进行了相应的主题分析。我们将这些研究工作进一步分为技术和部门类别。最后,我们认为我们认为在IML中为未来工作的研究机会进行了详尽的讨论。
translated by 谷歌翻译